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基于 机 器 学 习 的 重 离子 碰撞 中 QCD 相 变 
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摘要 高 能 重 离子 磁 撞 将 夸克 和 胶 子 从 原子 核 中 释放 出 来 ,形成 一 种 新 的 核 物质 形态 , 即 解禁 闭 的 夸克 胶 子 等 
离子 体 (Quark-Gluon Plasma,QGP)。 研 究 普通 核 物质 或 强 子 共振 气体 到 夸克 胶 子 等 离子 体 的 相 变 ,需要 在 超 
级 计算 机 上 数值 求解 格 点 量子 色 动 力学 (Quantum Chromodynamics,QCD)。 但 是 , 格 点 QCD 只 能 给 出 零 重 子 
化 学 势 以 及 附近 可 泰勒 展开 区 域 的 核 物 质 状 态 方 程 ,并 预测 这 种 条 件 下 QGP 到 强 子 共振 气体 之 间 的 相 变 为 平 
滑 过 渡 。 在 不 能 做 泰勒 展开 的 有 限 重 子 化 学 势 区 域 , 格 点 QCD 会 遭遇 著名 的 符号 问题 ,无 法 给 出 有 效 的 核 物质 
re nn 本 文 综述 了 利用 机 器 学 习 在 核 物质 状态 方程 . 相 变 分 类 以 及 临界 点 寻找 方面 的 
研究 。 这 些 而 e S 第 一 类 在 高 能 重 离 子 碰撞 实验 数据 以 及 相对 论 流体 力学 模拟 和 分 子 动力 学 模 
拟 中 ,利用 核磁 撞 末 态 粒子 分 布 来 确定 核 物质 状态 方程 以 及 相 变 种 类 ; 另 一 类 是 利用 机 器 学 习 直 接 帮助 格 点 
QCD 的 采样 ,解决 有 限 密 系统 中 的 符号 问题 
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Application of machine learning to the study of QCD transition in heavy ion collisions 
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Abstract In high-energy heavy ion collisions, quarks and gluons are released from the colliding nucleus to form a 
new state of nuclear matter called deconfined quark gluon plasma (QGP). To study the transition from normal nuclear 
matter or hadron resonance gas to QGP, non-perturbative quantum chromodynamics (QCD) must be solved on 
supercomputers using the lattice numerical method (lattice Quantum Chromodynamics, lattice QCD). However, 
lattice QCD only works for zero and small baryon chemical potential regions that can be described by the Taylor 
expansion and provides the nuclear equation of state (EoS) and QCD transition in these regions. For large baryon 


chemical potential regions that cannot be described by the Taylor expansion, lattice QCD fails to provide the nuclear 
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EoS and QCD transition owing to the famous sign problem. Machine learning helps to study the nuclear EoS and 


QCD phase transition. First, machine learning can determine the nuclear EoS and QCD transition using the 


momentum distribution of final state hadrons in heavy-ion collisions, with data from both heavy-ion collision 


experiments and relativistic hydrodynamic simulations. Second, it can contribute to the direct solution of the sign 


problem in lattice QCD. The present paper reviews the applications of machine learning to the study of the QCD 


phase transition in heavy-ion collisions. This study (1) introduces nuclear EoS and QCD transition as well as the 


difficulty of the lattice QCD method, (2) analyzes the nuclear EoS using Bayesian analysis, (3) identifies the nuclear 


EoS and QCD phase transition using different types of deep neural networks (e. g., convolutional neural network, 


point cloud network, and many-event averaging), (4) searches for critical self-similarity using a dynamical edge 


convolution-based graph neural network, (5) learns the quasi-particle mass using a physically informed network and 


auto-differentiation, (6) discards unphysical regions in the nuclear EoS with a critical endpoint using active learning, 


(7) discusses unsupervised learning for the nuclear liquid-gas phase transition, (8) determines the nuclear symmetry 


energy in heavy-ion collisions, (9) investigates Mach cones using deep learning assisted jet tomography, and (10) 


accelerates the sampling of lattice QCD configurations using a physically constrained neural network while solving 


the sign problem in lattice QCD using deep learning. 


Key words Heavy ion collisions, Machine learning, QCD phase transition, Deep neural network, Ai4Science 


夸克 和 胶 子 总 是 以 色 单 态 的 形式 囚禁 在 强 子 
中 。 核 子 重 如 牛 , 对 撞 生 新 态 ”, 李 政道 先生 提出 使 
用 高 能 重 离子 碰撞 产生 高 温 高 密 的 核 物质 环境 ,将 
夸克 和 胶 子 从 原子 核 中 释放 出 来 ,生成 夸克 胶 子 等 
离子 体 (Quark-Gluon Plasma,QGP ) 并 研究 核 物质 的 
解禁 闭 过 程 。 高 能 重 离子 碰撞 的 实验 和 理论 已 经 取 
得 了 长 足 发展 。 实 验 上 已 经 发 现 ,QGP 存在 的 多 个 
信号 ,比如 高 能 核磁 撞 末 态 强 子 在 动量 空间 存在 很 
强 的 集体 流 ,奇异 夸克 的 增强 ,高 能 部 分 子 喷 注 穿 过 
QGP 时 的 巨大 能 量 损失 。 理 论 方面 也 建立 了 色 玻 

璃 凝聚 ,相对 论 流体 力学 ,高 能 部 分 子 输 运 的 线性 玻 
尔 兹 曼 模 型 以 及 强 子 输 运 的 相对 论 分 子 动力 学 模 
型 ,能够 很 好 地 描述 高 能 部 分 子 的 能 量 损 失 以 及 中 
低 横 动量 区 末 态 强 子 的 动量 分 布 。 使 用 实验 数据 与 
理论 模型 的 对 比 , 研 究 者 发 现 QGP 是 实验 室 中 产生 
的 温度 最 高 ,磁场 最 强 , 剪 切 黏 滞 系 数 最 小 ,旋转 速 
度 最 快 的 流体 ,又 称 核 液 滴 。 关 于 相对 论 重 离子 磁 
撞 更 加 详尽 的 信息 ,请 参考 文献 [1-3]。 
在 高 能 重 离 子 磁 撞 理论 模型 与 实验 数据 的 对 比 
过 程 中 ,研究 者 过 到 极 大 的 困难 。 高 能 核磁 撞 是 1 
型 的 反问 题 ,QGP 的 寿命 只 有 10*s 左 右 ,QGP 火球 
的 大 小 只 有 10 fm, 实 验 上 不 能 直接 探测 到 QGP。 
高 能 核 页 撞 实验 是 典型 的 反问 题 ,只 能 通过 探测 器 


详细 考虑 了 高 能 核 碰撞 过 程 中 的 所 有 可 能 发 生 的 物 
理 过 程 , 并 用 已 知 最 好 的 理论 来 对 其 进行 描述 。 比 
如 ,在 美国 布鲁克 海 文 国家 实验 室 , 金 原子 核 被 加 速 
到 99.99% 倍 光速 ,在 欧洲 核子 中 心 , 铅 原子 核 被 加 
速 到 99.999 9% 倍 光速 以 上 ,这 种 情况 下 会 发 生 极 
山 的 相对 论 效 应 , 即 尺 缩 与 钟 慢 。 在 实验 室 参 考 系 
观察 ,原子 核 在 束 流 方向 的 直径 分 别 被 压缩 70 和 
700 多 倍 , 原 子 核 内 部 的 时 间 演 化 也 变 慢 70 和 700 
多 倍 , 核 子 中 的 真空 涨 落 没 有 足够 时 间 回 到 真空 Ab 
撞 发 生 时 不 是 几 个 价 夸 克之 间 的 稀 玻 碰撞 ,而 是 大 
量 海 夸克 与 海 胶 子 的 密集 碰撞 。 这 对 应 着 色 玻 璃 凝 
聚 以 及 胶 子 饱和 的 初 态 条 件 。 当 QGP 达到 局 部 热 
化 ,大 量 夸 克 和 胶 子 之 间 的 多 体 相 互 作 用 可 以 用 相 
对 论 流 体力 学 描述 ,此 时 QGP 的 温度 高 达 几 百 兆 电 
子 伏特 ,真空 中 时 刻 存 在 大 量 的 夸克 反 夸 克 对 的 激 
发 和 潭 灭 ,夸克 的 数量 ` 反 夸克 的 数量 、 正 电荷 的 数 
量 、 负 电荷 的 数量 不 能 单独 守恒 。 此 时 只 能 使 用 基 
于 能 动量 守恒 、 净 重子 数 守恒 、 净 电荷 数 守 恒 的 相对 
论 流体 力学 来 模拟 。 模 拟 的 过 程 需要 知道 QGP 达 
到 局 部 热 化 的 时 间 , 它 的 初 态 分 布 与 涨 落 ,QGP 在 
^l HE FR 837) Sk jt 55 P ditt QGP 的 状态 方程 
( 即 压强 作为 温度 和 重子 化 学 势 的 函数 ) ,QGP 冷却 
转化 为 强 子 气体 的 温度 等 信息 。 当 QGP 转化 为 强 
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id 
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捕获 的 末 态 粒子 的 四 动量 并 结合 高 能 核 碰撞 的 理论 


子 共振 气体 之 后 ,还 需要 使 用 相对 论 的 分 子 动力 学 


PEE 吉 构 和 核 物质 的 性 质 信 
上 县。 高 能 核 碰撞 理 论 相 当 于 建立 一 个 前 向 模型 ,给 
定 不 同 的 初始 条 件 , 核 物质 输 运 系数 和 状态 方程 ,这 
个 前 向 模型 能 够 快速 模拟 一 次 核 核 碰撞 ,这 个 模型 
可 以 认为 是 核磁 撞 实 验 的 数字 挛 生 系统 。 理 论 模型 


模型 继续 模拟 大 量 强 子 之 间 的 碰撞 、 共 振 产 生 和 衰 
变 过 程 。 可 以 看 到 ,高 能 核 碰撞 仿真 的 标准 模型 非 
常 复 杂 ,涉及 色 玻 璃 凝聚 .相对 论 流体 以 及 强 子 输 运 
几 个 过 程 中 的 众多 参数 ,使 用 不 同 的 模型 参数 , 核 碰 
撞 仿 真 可 以 产生 不 同 的 末 态 强 子 分 布 。 但 如 何 设置 
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模型 参数 组 合 才 能 让 理论 模型 描述 实验 观测 数据 是 
很 困难 的 问题 。 甚 至 这 有 可 能 是 一 个 病态 的 反问 
题 , 即 很 多 种 不 同 的 参数 组 合 都 可 以 描述 实验 数据 ， 
此 时 通过 实验 数据 无 法 唯一 地 确定 高 能 核 碰 撞 的 初 
态 性 质 以 及 QGP 的 输 运 系数 .状态 方程 等 信息 。 如 
图 171 Bras ,理论 模型 的 输出 依赖 于 除了 状态 方程 之 
外 的 众多 参数 ,而 每 个 参数 可 以 影响 多 个 实验 的 可 
观测 量 。 这 种 多 个 模型 参数 与 多 种 实验 可 观测 量 之 
间 的 复杂 耦合 为 确定 核 物质 状 态 方程 或 其 他 模型 参 
数 带 来 极 大 困难 。 这 种 情况 的 出 现 一 部 分 原因 是 高 
能 核 碰撞 末 态 数据 经 过 了 压缩 和 降 维 ,实验 提供 的 
可 观测 量 并 没有 包含 所 有 的 核磁 撞 末 态 信 息 ; 男 
个 原因 是 末 态 粒子 谱 与 核 碰撞 过 程 中 的 多 个 参数 耦 
合 在 一 起 ,同一 个 物理 参数 可 以 影响 几 个 可 观测 量 ， 
同一 个 可 观测 量 对 多 个 物理 参数 敏感 。 这 种 模型 参 
数 与 未 态 可 观测 量 之 间 的 复杂 耦合 使 得 实验 与 理论 
的 对 比 异 常 艰难 。 
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Shear Viscosity 
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Experimental Data: 
T/K/P Spectra 
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x X Elliptic Flow 
Pre-equilibrium Dynainxs Re HBT 
Thermalization Time FZ Charge Correlations & BFs 
Quark/Hadron Chemistry SS 


Density Correlations 
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图 1 通过 高 能 核磁 撞 实 验 与 理论 模型 对 比 提取 核 物 质 状 态 
方程 所 遭遇 的 困难 外 
Fig.1 Demonstration of difficulty encountered when 
extracting the nuclear equation of state (EoS) through model- 
data comparison in heavy-ion collisions"! 


高 能 核 碰撞 理论 与 实验 结果 对 比 的 另 一 个 困难 
Je AEP SE ASTRAL AER LC e S HEINE BE 
[3] 2848. TERT lS RBA ANS A Ve VL Ps 7J 
ATHY, DA Be ah T Y EO, Be ba I 
ERER. WEG AEA RI , AA e EC 
丢失 而 无 法 从 末 态 反 演 到 初 态 , 也 无 法 通过 核磁 撞 
末 态 所 有 粒子 的 四 动量 反 推 出 初 态 核 结构 以 及 演化 
过 程 中 QGP 的 全 部 信息 。 焙 增 使 得 高 能 核磁 撞 理 
论 存在 很 大 的 不 确定 性 , 即 很 难 从 理论 上 确定 QGP 
的 某 个 重要 物理 参数 的 信息 是 否 在 剧烈 的 非 平 衡 态 
演化 过 程 中 幸存 了 下 来 ,并 编码 在 末 态 强 子 的 动量 
分 布 以 及 两 粒子 或 多 粒子 关联 中 。 灶 增 也 为 从 末 态 
粒子 分 布 解码 初 态 核 结构 和 QGP 的 性 质 带 来 额外 
的 困难 , 即 理论 反 演 的 存在 性 困难 。 

机 器 学 习 中 的 贝 叶 斯 推断 技术 以 及 深度 学 习 技 
术 为 求解 高 能 核 碰撞 物理 中 的 反问 题 提供 了 巨大 帮 
助 品 。 贝 叶 斯 推断 技术 通过 对 给 定 实验 数据 时 模型 
参数 的 后 验 分 布 采样 ,可 以 获得 全 局 拟 合 情 况 下 的 
理论 模型 参数 的 分 布 ,从 而 得 到 最 优 参数 组 合 以 及 


不 同 参 数 的 不 确定 度 。 深 度 学 习 技术 推动 了 当前 的 
人 工 智 能 热潮 , 它 非常 擅长 在 不 同 的 数据 源 之 间 建 
立 映 射 。 高 能 核 碰撞 理论 模型 可 以 获得 不 同 物理 参 
数 设 置 下 的 末 态 粒子 分 布 , 即 在 前 向 过 程 中 建立 参 
数 数据 源 与 末 态 粒子 数据 源 的 映射 。 而 深度 学 习 中 
的 监督 学 习 技术 可 以 通过 训练 多 隐藏 层 人 工 神 经 网 
络 , 在 末 态 粒子 数据 源 与 参数 数据 源 之 间 建 立 道 向 
上 映射。 建立 逆向 映射 的 过 程 是 从 零 开始 逐渐 尝试 的 
过 程 ,如 果 最 终 尝 斌 成功, 说明 物 理 参数 的 信息 没有 
因为 炉 增 而 完全 消失 ,深度 学 习 技 术 可 以 把 物理 参 
数 的 信息 从 末 态 粒子 分 布 中 解码 出 来 ;如 果 党 试 失 
败 , 说 明 物 理 参数 的 信息 要 么 因为 蚁 增 而 消失 ,要 么 
深度 神经 网 络 的 表示 能 力 还 不 足以 建立 两 者 之 间 的 
非 线 性 映射 。 深 度 学 习 从 一 定 程度 上 解决 了 理论 反 
演 的 存在 性 难题 。 深 度 学 习 除了 解决 理论 反 演 的 存 
在 性 难题 , 它 还 同时 给 出 了 理论 反 演 的 答案 。 使 用 
机 器 学 习 中 的 可 解释 性 研究 ,可 以 找到 深度 神经 区 
络 输 入 数据 中 对 最 终 决 策 起 到 决定 性 作用 的 区 域 。 
这 些 区 域 对 应 着 输入 图 片 中 的 多 部 位 关联 ,或 者 输 
入 粒子 云 中 的 多 粒子 关联 。 在 AI for Science WAM 
域 , 可 解释 性 研究 为 物理 学 提供 了 很 多 启发 。 比 如 ， 
根据 输入 图 片 或 点 云 中 起 决定 性 作用 的 区 域 ,可 以 
获知 最 重要 的 动量 区 间 。 

高 能 核 碰撞 的 一 个 重要 研究 目标 是 确定 不 同 温 
FECT) PLE OA Cus) ZIE F QGP 向 普通 核 物质 
以 及 强 子 共振 气体 转变 的 量子 色 动 力学 (Quantum 
Chromodynamics, QCD) 相 变 类 型 。 温 度 是 核 物 质 
中 组 分 粒子 的 平均 热 运动 动能 ,重子 化 学 势 反 映 了 
核 物 质 中 的 正 反 物 质 比 例 。 比 如 , 当 原 子 核 以 接近 
光速 运动 并 对 撞 时 ,入 射 核 与 靶 核 如 透明 般 互 穿 , 只 
在 穿 过 的 中 心 快 度 区 域 激发 出 大 量 的 股子 、 夸 克 与 
反 夸 克 。 这 个 区 域 的 正 物 质数 量 (夸克 ) 与 反 物 质 
〈 反 夸克 ) 数 量 基本 相等 ,对 应 零 重 子 化 学 势 。 另 外 ， 
宇宙 早期 的 温度 非常 高 ,从 真空 中 激发 出 大 量 的 正 
反 物 质 , 正 反 物 质数 量 基 本 相等 ,也 对 应 着 低 重 子 化 
学 势 。QCD 相 风 中 的 高 温 低 重子 化 学 势 区 域 对 应 
欧洲 核子 中 心 的 超 相 对 论 重 离子 碰撞 实验 以 及 宇宙 
FAW], Lattice QCD 预测 这 个 区 域 QGP 到 强 子 共振 气 
体 的 相 变 为 平滑 过 渡 , 即 此 区 域 热力 学 量 的 无 穷 阶 
导数 连续 。 在 中 低能 核 碰 撞 中 ,入 射 核 与 靶 核 中 的 
核子 (下 物质) 会 沉积 在 碰撞 重合 区 域 ,数量 远 多 于 
从 真空 中 激发 出 的 等 量 正 反 物质 ,因此 ,对 应 QCD 
相 图 中 的 中 间 温 度 和 高 重子 化 学 势 区 域 。 很 多 理论 
模型 预测 这 个 区 域 的 核 物质 相 变 种 类 为 一 阶 相 变 ， 
一 阶 相 变 的 端点 被 称 作 临界 点 。 

本 文集 中 介绍 在 重 离子 碰撞 领域 ,机 器 学 习 如 
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何 帮助 确定 核 物质 的 状态 方程 ,关于 机 器 学 习 在 物 
理 以 及 核 物理 中 更 加 广泛 的 应 用 ,可 以 参考 文献 [6- 
14]。 本 文 内 容 包括 :1) 使 用 Lattice QCD 研究 核 物 
质 状态 方程 以 及 相 变 种 类 遭遇 的 困难 ;2) 使 用 贝 叶 
斯 分 析 方 法 研究 核 物质 相 变 和 状态 方程 ;3) 深 度 神 
经 网 络 方法 介绍 ,以 及 区 分 核 物质 状态 方程 常用 的 
卷 积 网 络 ,点 云 网 络 和 多 事件 平均 技术 :4) 使 用 动态 
棱 卷 积 图 神经 网 络 寻 找 临界 自 相似 ;5) 使 用 Lattice 
QCD 状态 方程 学 习 准 粒子 质量 ;6) 主 动 学 习 排 除 不 
稳定 的 参数 空间 ;7) 核 液 气相 变 ;8) 低 能 核 碰撞 , 确 
定 对 称 能 ;9) 马 赫 锥 与 核 物 质 状 态 方程 的 关系 以 及 
使 用 机 器 学 习 寻 找 马 赫 锥 ;10) 辅 助 Lattice QCD X 
样 , 帮 助 解决 Lattice QCD 的 符号 问题 。 


1 Lattice QCD 的 符号 问题 


在 离散 的 四 维 时空 写 下 QCD 的 配 分 函数 : 
Z(B.N,,N.) = [|puprDEe "^ — (n 


其 中 :p= VT = Na 表示 温度 的 倒数 ;N. 是 离散 化 的 
时 间 格 点 数 ;a 是 离散 化 的 时 空格 子 大 小 ;N, 表 示 每 
个 空间 维度 的 离散 化 格子 数 。U, ,表示 SU(3) 空 间 
的 规范 场 ,用 *w 标 注 格子 之 间 的 规范 链 ,到 和 到 表 
MS DAR HH. HHS, = Sot So 和 Sr 分别 
表示 胶 子 和 夸克 的 作用 量 。 此 配 分 函数 相当 于 对 夸 
殉 场 和 胶 子 场 做 路 径 积 分 , 费 米子 自由 度 可 以 解析 
BR to AN TA) AN od Hy AM SR T A By AY (Field 
configurations) 对 应 不 同 的 作用 量 , 以 及 不 同 构 型 出 
现 的 概率 。 配 分 函数 是 所 有 可 能 的 场 构 型 的 非 归 一 
化 概率 之 和 。 使 用 马尔 科 夫 链 蒙 特 卡 罗技 术 可 以 从 
上 述 非 归 一 化 的 概率 分 布 采样 ,获得 大 量 的 夸克 场 
和 胶 子 场 构 型 。 使 用 这 些 采 样 出 的 夸克 场 和 胶 子 
场 ,可 以 计算 零 重子 化 学 势 和 有 限 温 度 下 核 物 质 的 
状态 方程 , 即 压强 ,能 量 密度 , 炉 密 度 以 及 迹 反 常 
(Trace anomaly) 与 温度 之 间 的 关系 。 比 如 ,有 了 这 
些 构 型 ,可 以 获得 迹 有 反常 : 
€ - 3P d/{P V dinZ 
pe qm ar T! | Rana € 
使 用 式 (2) 还 可 以 计算 出 压强 与 温度 的 关系 以 
及 能 量 密度 与 温度 的 关系 ,从 而 得 到 压强 与 能 量 密 
度 之 间 的 关系 P= P(e) 以 及 热 密 核 物质 的 声速 : 
>. dP 
<= e (3) 
4H LAE EA BR A A rufa HARDER TE 
的 破坏 ,夸克 场 高 斯 积分 中 的 虚数 部 分 不 能 与 反 夸 
克 场 对 应 的 积分 相 消 , 导致 被 积 函数 出 现 严 重 的 振 
Wi 528 JEn [ e ”cos(ur)dr, 其 被 积 函数 如 图 2 所 


C 


示 , 假 设 4& 代 表 重 子 化 学 势 , 纵 轴 表示 被 积 函数 。 


Demo of Sign Problem 


ee ee ee 
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x 


图 2 格 点 QCD 符 号 问题 示意 加 
Fig.2 Demonstration of the sign problem in lattice QCD 
在 零 重子 化 学 势 附近 ,可 以 对 状态 方程 进行 泰 
勒 展开 ,获得 低 重 子 化 学 势 区 域 的 状态 方程 。 
泰勒 展开 在 化 学 势 较 大 的 区 域 自动 失效 ,直接 使 用 
Lattice QCD 又 会 遇 到 上 面 展示 的 符号 问题 ,因此 ， 
目前 基于 非 微 扰 QCD 的 第 一 性 原理 计算 技术 
Lattice QCD 只 能 探索 核 物质 相 图 中 的 很 小 一 个 区 
域 , 无 法 给 出 临界 点 的 存在 性 与 具体 位 置信 息 。 


2 ”使 用 贝 叶 斯 分 析 从 实验 与 理论 的 对 比 中 
确定 核 物 质 状 态 方 程 


根据 简单 的 联合 概率 密度 分 布 公 式 P(x,y)= 
P(xby)P(y)=P(yx)P(x) 可 以 得 到 贝 叶 斯 公式 : 
_ PO) P(x) 
P (xy) = P(y) (4) 
在 高 能 核 碰 撞 物理 中 ,x 表示 理论 模型 参数 ,y 
表示 实验 数据 。 贝 叶 斯 分 析 的 目标 是 在 获得 新 的 实 
验 数据 的 情况 下 ,计算 理论 模型 参数 x 的 后 验 分 布 
P(xby )。 此 后 验 分 布 可 以 简单 看 作 理 论 模 型 参数 满 
足 的 概率 密度 分 布 函数 , 它 有 均值 ` 有 方差 ` 有 峰值 。 
确定 峰值 所 对 应 的 x 称 作 最 大 后 验 估计 ,方差 表示 
理论 模型 参数 的 不 确定 度 。 因 此 , 贝 叶 斯 分 析 不 仅 
可 以 帮助 物理 学 家 自动 寻找 最 优 的 模型 参数 组 合 ， 
而 且 可 以 将 实验 数据 中 的 误差 以 及 理论 模型 的 不 确 
定性 反 向 传递 到 参数 的 后 验 分 布 中 。 贝 叶 斯 公式 中 
的 P(ykx) 被 称 作 似 然 函数 , 它 量化 了 参数 为 x 的 理 
论 模 型 输出 与 实验 数据 y 之 间 的 似 然 程度 。P (x) 被 
称 作 模型 参数 的 先 验 , 即 新 的 实验 数据 出 现 之 前 大 
家 对 模型 参数 可 能 取 值 的 猜测 。 从 公式 可 以 看 出 ， 
先 验 和 似 然 都 会 影响 模型 参数 的 后 验 分 布 。 分 母 上 
的 归 一 化 常数 P(y) = [POTO P GO dx 被 称 作证 
据 ,计算 需要 对 整个 参数 空间 , 即 x 的 所 有 可 能 取 值 


040014-4 


202306.00132v1 


chinaXiv 


ChinaXiv (ERAT 


李 甫 鹏 等 ， 基 于 机 器 学 习 的 重 离 子 碰撞 中 QCD 相 变 的 研究 


进行 积分 ,因此 计算 量 巨大 。 幸 运 的 是 ,马尔 科 夫 链 


VT" =0 (7) 


蒙特 卡 罗 技 术 可 以 对 如 下 形式 的 非 归 一 化 的 概率 密 
度 采样: 


P(xby) < P(ylx)P(x) (5) 
因此 , 贝 叶 斯 分 析 技 术 其 实 是 对 理论 模型 参数 x 
的 非 归 一 化 后 验 概率 密度 P(xly) 分 布 采 样 的 过 程 。 
使 用 马尔 科 夫 链 蒙 特 卡 罗技 术 , 可 以 从 参数 空间 中 
任意 一 点 xz 出 发 ,根据 细致 平衡 条 件 做 随机 行走 : 
XXe (6) 
式 中 :e 是 随机 行走 的 步 长 ,可 以 从 均匀 分 布 或 高 斯 
分 布 采 样 。 行 走 的 脚印 ,或 者 说 参数 空间 中 的 历史 
轨迹 形成 一 个 集合 {xo,x1,…,X,}, 这 个 集合 即 是 对 
后 验 概率 密度 分 布 的 采样 。 对 这 些 采 样 做 密度 估 
VF ,就 可 以 得 到 后 验 分 布 的 峰值 位 置 以 及 方差 。 
格 点 QCD 预言 相对 论 重 离子 对 撞 机 
(Relativistic Heavy Ion Collider, RHIC) 和 大 型 强 子 
对 撞 机 (Large Hadron Collider, LHC) 能 量 下 的 核 核 
人 磁 撞 产生 高 温 低 重子 化 学 势 的 夸克 股子 等 离子 体 ， 
冷却 强 子 化 经 历 了 一 个 平滑 过 渡 (Crossover)。 一 个 
很 重要 的 问题 是 :是 否 能 在 实验 上 验证 QCD 相 图 上 
的 这 个 区 域 经 历 了 平滑 过 渡 ? 是 否 能 够 通过 RHIC 
和 LHC 的 大 量 实验 数据 确定 这 个 区 域 核 物质 状态 
方程 的 形式 , 即 压强 作为 能 量 密度 的 函数 。 为 了 解 
决 这 个 问题 ,首先 需要 在 高 能 核 核 碰撞 的 理论 模型 
中 确立 核 物质 状态 方程 对 末 态 可 观测 量 的 正 问 影 
向 ,这 一 步 可 以 通过 相对 论 流 体力 学 实现 ”。 零 
EE 子 化 学 势 下 ,相对论 流体 力学 求解 如 下 能 动量 守 
方程 : 


Id 


limi 


D 


imi 


其 中 :能量 动量 张 量 7T*= (e+P)uw - Pg" +n", 
ce 是 能 量 密度 ,P 是 压强 ,w 是 流体 的 四 速度 ,mn* 是 前 


切 条 灌 张 量 。 相 对 论 流体 力学 公式 描述 了 夸克 胶 子 
等 离子 体 以 及 高 温 高 密 的 强 子 物质 的 时 空 膨胀 演 
化 。 膨胀 的 驱动 力主 要 是 压强 梯度 和 剪 切 攻 沸 。 改 
变 状态 方程 , 即 压强 与 能 量 密度 的 函数 关系 ,会 改变 
热 密 核 物质 的 彩 胀 加 速度 。 在 相对 论 流体 力学 的 杠 
架 下 ,Pratt 等 5 构造 了 一 组 参数 化 的 状态 方程 ,通过 
理论 模型 与 实验 数据 的 对 比 ,计算 出 核 物质 状态 方 
程 参数 的 后 验 分 布 。 参 数 化 的 形式 如 下 ; 

ec - cle) [$- eco] TEL e 
图 3 是 使 用 贝 叶 斯 分 析 提取 出 的 高 温度 零 重子 
化 学 势 区 域 的 核 物质 状态 方程 。 不 难看 出 ,未 做 约 
束 之 前 ,状态 方程 参数 的 先 验 分 布 接近 均匀 分 布 , 参 
数 取 值 有 很 大 的 不 确定 度 ,导致 状态 方程 以 及 声速 
的 平方 有 很 多 可 能 的 取 值 。 通 过 实验 与 流体 力学 输 
出 结果 的 对 比 ,可 以 计算 出 似 然 函 数 。 通 过 贝 叶 
分 析 , 计 算出 参数 满足 的 非 归 一 化 后 验 分 布 并 采样 
最 终 获得 符合 高 能 核磁 描 实 验 数 据 的 核 物 质 状态 方 
程 。 可 以 看 到 ,经 过 实验 数据 的 约束 ,状态 方程 的 可 
能 取 值 范围 缩小 到 一 个 很 小 的 区 域 , 目 与 Lattice 
QCD 预测 的 高 温 低 密 核 物质 状态 方程 相 匹配 。 在 
使 用 贝 叶 斯 分 析 拟 合 其 他 模型 参数 的 过 程 中 ， 
Lattice QCD 的 状态 方程 一 般 直 接 作 为 输入 ””。 最 
过, 文献 [23] 使 用 贝 时 斯 方法 ,通过 对 重 离子 碰撞 产 
生 的 末 态 质子 的 平均 模 动 能 量 以 及 椭圆 流 的 分 析 ， 
从 而 有 效 地 约束 了 高 密 区 的 QCD 状态 方程。 


图 3 使 用 贝 叶 斯 分 析 提 取出 的 高 温 零 了 


Fig.3 Extraction of nuclear EoS at a high temperature and zero baryon chemical potential region using Bayesian analysis? 


贝 叶 斯 分 析 技 术 能 够 充分 利用 物理 先 验 以 及 实 
验 提供 的 低 维 数据 ,并 把 实验 误差 甚至 是 理论 模型 
误差 通过 似 然 函 数 向 后 传递 到 参数 的 后 验 分 布 。 这 
种 技术 的 一 个 缺点 是 最 终结 果 依赖 于 人 工 设 定 的 参 


EE 子 化 学 势 区 域 的 核 物质 状态 方程 ” 


数 化 函数 形式 ,可 能 会 引入 人 为 偏见 。 另 一 个 缺点 
是 高 维 实验 数 据 向 低 维 可 观测 量 压缩 投影 的 过 程 中 
损失 了 大 量 信息 , 贝 叶 斯 分 析 技 术 不 能 帮助 从 原始 
数据 中 发 现 新 的 可 观测 量 。 
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3 ”深度 神经 网 络 确定 核 物 质 状 态 方程 


深度 学 习 (Deep Learning) AEREE AS FR 
层 人 工 神经 网 络 。 深 度 学 习 领 域 的 三 驾 马 车 之 一 
LeCun 将 深度 学 习 定 义 为 构造 层级 化 的 泛 函 模块 ， 
并 通过 梯度 下 降 对 其 优化 的 方法 。 根 据 这 个 定义 ， 
深度 神经 网 络 提 供 了 将 输入 x 非 线性 的 映射 到 输出 
J 的 泛 函 模块 ,写成 函数 形式 为 f(x,0), 在 监督 学 习 
中 ,如 果 知 道 标 准 答案 y, 则 优化 目标 是 神经 网 络 输 
出 与 标准 答案 之 间 的 距离 ,定义 为 损失 函数 : 

LC0)-Distancel yf (x, 0)] 

损失 函数 也 是 函数 /的 函数 ,返回 值 为 标量 ,所 
以 称 为 泛 函 。 优 化 的 目标 是 通过 调整 神经 网 络 参 数 
0 的 方式 来 逐渐 减 小 神经 网 络 输出 与 标准 答案 之 间 
的 距离 。 

接 下 来 介绍 神经 网 络 的 参数 0 及 其 优化 方式 。 
考虑 简单 的 线性 变换 ， z=xW+Db, 其 中 :输入 x 是 拥有 
m 个 元 素 的 行 向 量 ,W 是 m 行 n 列 的 矩阵 ,bp 是 1 行 n 
列 的 矩阵 ,这 样 的 矩阵 操作 返回 一 个 新 的 n 个 元 素 
Ez WAI b PEREIGA 本 被 记 作 0。 ix^ AB 
阵 操作 相当 于 把 mn 维 空间 的 向 量 通 过 旋转 、 缩 放 、 平 
移 以 及 升降 维 度 的 方式 变换 到 维 空间 。 这 种 矩阵 
操作 可 以 用 如 下 的 单 层 人 工 神经 网 络 表示 ,第 i 个 输 
入 神经 元 与 第 /个 输出 神经 元 之 间 的 连接 权重 的 值 
SFT AB EEG ,每 个 输出 神经 元 还 要 另外 加 上 偏 置 
b,。 此 时 ,人 工 神 经 网 络 拥有 简单 的 线性 表示 能 力 ， 
可 以 用 于 线性 拟 合 任务 。 单 纯 增 加 线性 神经 网 络 的 
层 数 不 能 增强 其 表示 能 力 ,原因 是 多 个 矩阵 的 乘积 
等 于 一 个 和 矩阵。 将 z 的 每 一 个 元 素 都 做 一 个 非 线性 
变换 有 = o(z), 则 会 为 人 工 神经 网 络 带 来 更 强大 的 
表示 能 力 。 原 则 上 只 要 在 输入 和 输出 层 之 间 添 加 一 
个 隐藏 层 ,在 足够 多 神经 元 的 情况 下 ,神经 网 络 就 会 
拥有 通 近 任何 连续 函数 的 能 力 。 图 4 为 一 个 单 屋 人 
工 神经 网 络 示 意图 。 

神经 网 络 的 参数 一 般 按 特定 的 方式 初始 化 为 随 
机 数 , 以 避免 多 个 矩阵 连 乘 导致 的 梯度 消失 或 梯度 
爆炸 。 初 始 时 神经 网 络 将 输入 x 随机 地 映射 到 输出 
f(x,0), 对 于 给 定 的 输入 ,神经 网 络 做 出 随机 预测 ， 
预测 结果 与 标准 答案 存在 较 大 的 偏差 。 在 深度 学 习 
中 ,一 般 使 用 随机 梯度 下 降 算法 (Stochastic Gradient 
Descent, SGD) 对 神经 网 络 中 的 每 一 个 参数 进行 更 
新 。 最 简单 的 SGD 版 本 中 ,参数 的 更 新 方法 为 : 


1 m ðL, 
Oni 0, RE m 2s (9) 


da Rae L, JA 个 样本 的 损失 函数 。 


图 4 单 层 人 工 神经 网 络 对 数据 的 变换 等 价 于 线性 矩阵 操作 
xW+b ,再 使 用 非 线性 激活 函数 将 z 的 每 个 元 素 进行 变换 
Fig.4 A single layer artificial neural network transforms the 
input data by a linear matrix operation z=xW+b, in combination 
with a non-linear operation on each element of the output z 
using a non-linear activation function 


使 用 损失 函数 的 负 梯 度 来 更 新 每 个 参数 的 值 , 可 以 
让 损失 函数 的 值 逐 渐 减 小 。 这 一 点 可 以 通过 简单 的 
列子 说 明 ,如 果 万 = 多 , 则 极 小 值 的 位 置 为 0,=0 
处 ,任意 处 负 梯 度 为 - 20, 如 果 初 始 的 0,>0, 使 
H- 260, 更 新 参数 会 让 其 减 小 ,相反 ,如 果 初 始 化 时 
0, < 0, 则 负 梯 度 - 260, > 0, 也 会 朝 着 损失 函数 减 小 
的 方向 更 新 。 中 等 大 小 的 人 工 神 经 网 络 拥有 上 千 万 
个 可 训练 参数 ,神经 网 络 学 习 的 过 程 需要 计算 损失 
函数 对 每 个 参数 的 负 梯 度 。 数 值 的 有 限 差 分 算 ; 
带 来 不 可 控 的 截断 误差 与 舍 入 误差 ， ueri 
遇 表 达 式 膨胀 问题 ,计算 效率 低下 。; 学 习 中 的 
负 梯 度 一 般 使 用 自动 微分 "(Auto oe 
计算 , 它 是 拥有 解析 精度 的 高 效 数值 微分 算法 ,被 广 
泛 用 于 深度 神经 网 络 的 优化 以 及 求解 常 微分 方程 和 
偏 微分 方程 的 Physics Informed Neural Network 中 。 
文献 [ 24 开创 了 使 用 深度 学 习 这 种 强大 的 模式 
识别 工具 判断 核 物质 状态 方程 以 及 相 变 种 类 的 先 
河 。 如 图 5(a) 所 示 ,QCD 相 图 上 平滑 过 渡 区 
(Crossover) 对 应 的 状态 方程 用 赣 色 虚线 表示 , 即 压 
强 作 为 能 量 密度 的 函数 在 高 能 量 密度 区 (夸克 股子 
等 离子 体 相 ) 与 低能 量 密度 区 ( 强 子 共振 气体 相 ) 之 
间 是 光滑 的 插值 函数 ,标记 为 EOSL。 一 阶 相 变 区 
(First order phase transition) 对 应 的 状态 方程 用 红色 
实 线 表示 ,标记 为 EOSQ, 压 强 P 作 为 能 量 密度 c 的 
函数 在 相 变 区 域 存在 平台 结构 ,在 此 平台 上 压强 梯 
E dP/de = 0, QGP 的 膨胀 加 速度 为 0, 出 现 集体 流 又 
减 壳 层 。 反 映 在 图 SCb) 中 ,使 用 EOSL, 热 密 核 物质 
时 空 演化 过 程 中 能 量 密度 分 布 更 加 平滑 均匀 ,使 用 
EOSQ, 因 为 一 阶 相 变 区 的 影响 ,能 量 密度 分 布 存在 
更 多 的 山岭 状 结 构 。QGP 集 体 流动 过 程 中 的 区 别 
会 反映 在 最 终 末 态 强 子 的 动量 分 布 上 。 这 个 研究 展 
示 了 使 用 传统 的 物理 可 观测 量 , 无 法 根据 每 个 事件 
的 末 态 粒子 谱 区 分 QGP 演化 时 遵循 的 状态 方程 。 
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图 $ 使 用 深度 卷 积 神经 网 络 从 末 态 粒子 分 布 提取 核 物 质 状 态 方程 以 及 相 变 种 类 信息 外 


Fig.5 [Identification of the nuclear EoS and types of phase transition from the final state particle spectra using deep convolutional 


neural network?" 


既然 深度 学 习 可 以 从 大 量 的 猫 狗 图 片 中 提取 最 
有 用 的 特征 或 特征 组 合 , 实 现 对 不 在 训练 集中 的 猫 
狗 分 类 , 那 它 是 否 可 以 被 用 来 从 相对 论 重 离 子 碰撞 
逐个 事件 的 末 态 粒子 分 布 中 提取 特征 组 合 ,从 而 关 
断 夸 克 胶 子 等 离子 体 到 强 子 共 振 气 体 之 间 的 相 变 种 
类 ? 文献 [24] 使 用 监督 学 习 的 思路 ,通过 相对 论 流 
体力 学 模拟 产生 大 量 的 高 能 核磁 撞 事 件 , 使 用 两 种 
状态 方程 计算 出 的 末 态 强 子 谱 作 为 神经 网 络 的 输 
入 ,将 状态 方程 种 类 作为 神经 网 络 的 输出 ,训练 卷 积 
神经 网 络 在 输入 与 输出 之 间 建 立 映 射 。 在 这 个 研究 
中 ,输入 数据 为 15x48 个 像素 的 二 维 粒子 谱 
p(pr$), 表 示 15 个 不 同 的 横 动量 以 及 48 个 不 同方 
位 角 处 的 粒子 数 密度 。 输 出 层 有 两 个 神经 元 , 取 值 
都 在 (0,1) 之 间 , 和 为 1, 表 示 平 滑 过 渡 和 一 阶 相 变 
的 归 一 化 概率 。 这 一 步 使 用 softmax 激 活 函 数 实现 : 


> (10) 


= 


ot 


^j 


e 


qi 一 
Ay EAE — Rit f FH E SUR AR ERU soe LI 

个 概率 密度 分 布 之 间 的 差别 ， 
L= p, lnq; (11) 


式 中 :p 是 标准 答案 对 应 的 概率 密度 分 布 ;g 是 神经 
网 络 预 测 出 的 概率 密度 分 布 ;gq, 表 示 神 经 网 络 预 测 
输入 数据 的 标签 是 第 ;类 的 概率 。 如 果真 实 标签 是 
平滑 过 渡 , 则 : 


oe a 


如 果真 实 标签 是 一 阶 相 变 , 则 : 
0 d EosL 
»-[ atm (13) 
fE F] AMPT (A Multiphase Transport) fS 4! P^ E 
逐个 事例 相对 论 流体 力学 模拟 的 初始 条 件 ,使 用 两 
种 状态 方程 , 几 个 不 同 的 剪 切 符 清 系数 以 及 冷却 强 
子 化 温度 ,进行 相对 论 流体 力学 模拟 ,来 使 数据 尽 可 
能 地 多 样 化 。 如 图 5(d) 所 示 , 经 过 训练 的 人 工 神经 
网 络 在 三 组 不 同 的 测试 数据 集 上 都 能 达到 93% 以 
上 的 测试 精度 。 其 中 IEBE-VISHNU57 使 用 不 同 的 
初始 条 件 和 流体 力学 代码 ,CLVisc+IPGlasmac5 使 用 
与 训练 数据 相同 的 流体 力学 代码 和 不 同 的 初始 条 
件 ,体现 出 模型 良好 的 泛 化 能 力 。 模 型 数据 与 真实 
实验 数据 之 间 可 能 存在 偏差 ,为 了 减 小 此 偏差 ,后 续 
的 研究 一 方面 在 模型 中 加 入 强 子 输 运 ,考虑 QGP 转 
化 为 强 子 后 的 级 联 散射 .共振 产生 和 衰变 过 程 29 , 另 
一 方面 考虑 到 探测 器 的 有 限 接收 度 ,将 仿真 数据 进 
行进 一 步 的 探测 器 模拟 修正 下。 这 些 研究 发 现 , 如 
果 末 态 粒 子 存在 比较 大 的 涨 落 ,多 事件 平均 的 技术 
可 以 显著 增加 分 类 准确 度 。 

高 能 核 物理 以 及 粒子 物理 的 末 态 粒子 数据 结构 
为 天 然 的 动量 空间 的 点 云 。 如 果 使 用 卷 积 神经 网 
络 ,需要 对 粒子 进行 密度 估计 ,将 粒子 的 动量 投影 到 
(pwp;) 或 (px,p,) 等 二 维 离 散 空 间 , 产 生 图 片 。 这 
个 过 程 会 产生 精度 丢失 ,纵向 信息 损失 ,以 及 严格 守 
恒 律 的 破坏 。 如 果 保 留 纵 向 动量 , 则 三 维 格子 中 的 
粒子 信息 非常 稀疏 。 点 云 神经 网 络 直接 使 用 每 个 粒 
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子 的 四 动量 以 及 其 他 量子 数 作为 输入 ,精确 的 保留 
每 个 粒子 的 完整 信息 ,更 加 适用 于 高 能 核 物理 以 及 
粒子 物理 。 

文献 [28] 使 用 点 云 神经 网 络 区 分 一 阶 相 变 中 的 
Spinodal 类 型 和 Maxwell 类 型 状态 方程 。 其 中 
Spinodal 状态 方程 存在 一 个 声速 平方 c: = dP/de < 0 
的 不 稳定 区 域 , 这 个 区 域 会 导致 QGP 形成 多 个 分 离 
E 每 个 区 块 独 立 强 子 化 。Maxwell 构造 对 应 

前 介绍 的 EOSQ 状态 方程 ,存在 压强 梯度 为 0 的 
e 如 图 6 所 示 , 这 个 研究 将 一 个 全 连接 网 络 应 


Point Cloud of 420 Particles 


| Repeat for All Particles > 


Point Cloud Network, Repeat 2 Times 
1* Time m=5, 2" Time m=128 


Global Max Pooling 


用 于 每 个 粒子 ,将 其 四 动量 以 及 质量 转化 为 128 维 
高 维特 征 ,此 网 络 被 所 有 粒子 共享 ,又 称 一 维 卷 积 
全 局 最 大 池 化 Global Max Pooling 被 用 来 寻找 粒 f 
云 在 128 维特 征 空间 中 的 边界 ,这 些 边界 被 输入 到 
另 一 个 全 连接 神经 网 络 ,最 后 输出 一 个 神经 元 ,使 用 
Sigmoid 激活 函数 ,使 输出 满足 0 <y< 1。 其 中 > 
0.5 表 示 预 测 结 果 为 Spinodal,y < 0.5 表 示 预 测 结果 
为 Maxwell。 此 外 ,文献 L29] 还 使 用 点 云 神 经 网 络 
识别 QCD 状态 方程 中 的 一 阶 相 变 模 式 与 平滑 过 湾 

模式 ,其 分 类 的 准确 度 高 达 99.8%。 
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图 6 使 用 点 云 神经 网 络 从 动量 空间 的 末 态 粒子 云 提取 核 物质 状态 方程 信息 所 


Fig.6 Identification of the nuclear EoS from the final state particle cloud in momentum space using point cloud neural network"? 


4 ， 使 用 深度 学 习 帮 助 寻 找 相 变 临 表 点 


除了 利用 一 阶 相 变 区 集体 膨胀 加 速度 变 小 的 特 

点 ,还 可 以 使 用 临界 点 附近 涨 落 的 增强 现象 研究 核 
物质 相 变 。 在 临界 点 附近 ,关联 长 度 发 散 , 出 现 临界 
乳 光 和 标 度 不 变 。 后 者 在 物理 上 体现 为 不 同 分 辩 率 
下 观察 系统 出 现 类 似 分 形 的 自 相似 现象 。 文 献 [30] 
使 用 卷 积 神经 网 络 从 o 标 量 场 的 二 维 时 空 构 型 中 判 
断 是 否 存在 QCD 相 变 信息 。 文 献 [31-35] 建 议 临 界 
点 附近 的 粒子 可 外 8 满足 动量 空间 的 自 相 似 , 使 用 间 
歇 性 分 析 可 以 探测 重 离子 碰撞 中 的 自 相 似 性 和 临界 
波动 。 尽 管 最 近 欧 洲 核 子 研究 中 心 SPS 的 NA61/ 
SHINE 实验 5 在 150 AGeV 的 Ar+Sc 磁 撞 中 观察 
到 了 一 个 不 可 忽略 的 间 软 现象 ,但 背景 涨 落 很 大 , 守 
律 关 系 无 法 完全 确定 。 另 外 ,相近 碰撞 能 量 下 的 C+ 
C.Pb+Pb 和 Be+Be 碰 撞 并 没有 观察 到 间 砍 性 信和 号。 
临界 蒙特 卡 罗 模 拟 表明 ,在 Be+Be 碰 撞 中 ,| 临界 质子 
的 最 大 可 能 比例 小 于 0.3%, 这 表明 如 果 CMC 
(Critical Monte-Carlo) 无 粒子 的 分 数 与 不 相关 的 背 


景 相 比 很 小 ,那么 传统 的 间 软 性 分 析 可 能 无 法 寻找 
到 自 相 似 性 的 微弱 信号 。 使 用 间歇 性 分 析 寻 找 临 界 
信号 的 另 一 个 困难 是 探测 器 的 动量 分 辩 率 较 低 ,如 
果 按 照 探 测 器 的 分 辩 率 极限 给 蒙特 卡 洛 模型 产生 的 
每 个 末 态 粒子 添加 5% 的 动量 误差 , 则 间歇 分 析 无 
法 区 分 加 入 了 5% 或 10% 临界 关联 粒子 的 事件 。 
文献 [39] 使 用 点 云 神经 网 络 和 动态 棱 卷 积 神经 
网 络 来 寻找 重 离子 碰撞 中 每 个 事件 的 微弱 自 相 似 信 
号 。JAM(Jet AA Microscopic Transportation Model) 
蒙特 卡 罗 模 型 被 用 来 产生 Au+AuVsw = 27 GeV 中 
ORERE AY 22 万 个 事件 ,这 些 事 件 的 末 态 粒子 不 存在 
动量 空间 的 自 相 似 ,标记 为 JAM。CMC 模型 被 用 来 
产生 存在 动量 空间 自 相 似 的 关联 粒子 ,每 对 粒子 在 
动量 空间 的 间隙 Ap 满足 如 下 窜 律 分 布 : 
f (Ap) = Aap (14) 
中 :v= 是 三 维 伊 六 模型 普 适 类 对 应 的 一 个 临界 
指数 ,4 是 与 vy 有 关 的 一 个 归 一 化 常数 。 这 个 概率 密 
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度 分 布 的 累积 概率 函数 可 以 解析 求 出 , 且 有 反 函 数 ， 
可 以 使 用 反 函 数 法 抽样 Ap。 从 JAM 粒子 中 任 选 一 
个 动量 ,根据 抽样 得 到 的 Ap, 获 得 一 系列 有 关联 的 
CMC 粒子 。 文 献 [39] 将 一 部 分 JAM 事 件 中 5% 或 
10% 的 粒子 替换 成 存在 临界 自 相 似 的 CMC 粒子 ,并 
将 这 类 事件 标记 为 CMC。 点 云 神 经 网 络 和 动态 楼 
卷 积 神经 网 络 被 训练 来 区 分 两 种 事件 ,检验 深度 学 
习 是 否 能 从 大 量 背 景 粒子 中 挑选 出 少数 存在 长 程 关 
联 的 粒子 。 

图 7 是 动态 棱 卷 积 神经 网 络 的 架构 。 神 经 网 络 
的 输入 是 动量 空间 的 粒子 云 。 网 络 输出 分 为 两 部 
分 :第 一 部 分 处 理 分 类 任务 (Classification) ,输出 只 
有 一 个 神经 元 ,其 取 值 可 以 区 分 一 个 事件 中 是 否 存 
在 临界 信号 ; 另 一 部 分 处 理 标注 任务 (Tagging) , 输 
出 神经 元 的 个 数 等 于 输入 粒子 的 个 数 ,其 取 值 表示 
对 应 的 输入 粒子 是 信号 粒子 还 是 噪声 粒子 。 输 入 到 
输出 之 间 的 变换 使 用 动态 棱 卷 积 网 络 ,这 个 网 络 首 
先 寻 找 动 量 空间 每 个 粒子 的 个 最 近邻 粒子 ,然后 


使 用 一 个 全 连接 网 络 计 算 每 个 粒子 跟 它 一 个 邻居 的 


edge 信 息 : 


e; = net( pip;) (15) 
这 个 全 连接 网 络 被 所 有 的 粒子 对 共享 ,因此 称 
为 棱 卷 积 。 每 个 粒子 的 特征 和 K 个 edge 信 息 拼接 形 
成 一 个 向 量 [ poeseos tS en]; 一 起 输送 给 点 云 网 
络 , 作 进一步 的 处 理 。 由 此 可 知 , 相 比 点 云 网 络 , 动 
态 棱 卷 积 网 络 使 用 了 更 多 局 部 结构 信息 。 需 要 注意 
的 是 , 校 卷 积 可 以 重复 多 次 。 第 一 次 是 在 动量 空间 
寻找 每 个 粒子 的 k 个 最 近邻 粒子 ,从 第 二 次 开始 就 
是 在 特征 空间 寻找 每 个 粒子 的 上 近邻 粒子 ,这 也 是 
动态 棱 卷 积 名 称 的 来 源 。 特 征 空 间距 离 相 近 的 粒子 
在 动量 空间 可 能 相隔 其 远 , 因 此 ,这 种 神经 网 络 架 构 
擅长 从 大 量 粒子 中 寻找 存在 长 程 关 联 或 者 多 粒子 关 
联 的 信号 。 经 过 训练 , 棱 卷 积 神经 网 络 寻找 临界 信 
号 的 能 力 相 比 点 云 神 经 网 络 提高 10% 左 右 , 如 表 1 
所 示 。 


Particles (KNN + Edge Convolution ) x 2 Point Cloud Network Tagging 
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Find Its k Nearest Neighbors in Feature Space. © CP / JAM 


使 用 动态 棱 卷 积 网 络 寻找 动量 空间 的 临界 自 相 似 信号 HET E MR RKT 


Fig.7 Search for self-similarity in momentum space using dynamical edge convolution network and identification of correlated 


particles 


5 深度 学 习 准 粒子 质量 ,重建 Lattice QCD 

零 重 子 化 学 势 下 核 物质 状态 方程 可 以 通过 
Lattice QCD 进行 精确 的 计算 ,然而 ,计算 所 需 的 资 
源 以 及 耗 时 非常 昂贵 。 文 献 L[40] 中 对 比 了 Lattice 
QCD 与 简单 的 强 子 共振 气体 模型 所 计算 的 状态 方 
程 ,结果 表明 无 相互 作用 的 强 子 共振 气体 模型 能 够 
很 好 地 描述 7 < 150 MeV 区 域内 的 QCD 状态 方程 ， 


B9] 


但 是 在 高 温 区 域 却 存在 着 较 大 的 偏差 。 这 是 由 于 在 
高 温 区 域 , 夺 克 和 上 胶 子 不 仅 会 从 强 子 中 解禁 闭 出 来 ， 
还 会 从 真空 中 激发 出 许多 部 分 子 。 此 时 所 产生 的 热 
核 物质 自由 度 主 要 为 部 分 子 ,在 相 变 区 域 附近 存在 
很 强 的 相互 作用 。 文 献 [41] 假 设 热 密 的 QGP h E 
相互 作用 的 准 粒 子 组 成 ,其 质量 取决 于 介质 的 温度 。 
在 物理 学 上 ,这 些 准 粒子 代表 介质 中 的 夸克 和 胺 子 ， 
也 被 称 作 dressed 粒子 ,相当 于 把 相互 作用 势能 吸收 
到 每 个 准 粒子 的 质量 中 。 使 用 这 些 无 相互 作用 但 质 
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Wl 核 兰 积 神经 网 络 与 点 到 神经 网 络 寻 找 临 嘲 信号 的 性 能 量 之 后 ,就 可 以 计算 他 们 的 状态 方程 。 对 于 一 个 天 
Table 1 Comparison between the performances of 相互 作用 的 准 夸 克 和 胶 子 气体 , 它 的 配 分 函数 为 


dynamical edge convolution network and point cloud InZ(T) 7 In Zt > In Z, (T) (16) 
network when searching for critical phenomenon i f 


关联 粒子 比例 动态 楼 卷 积 网 络 分 类 点 云 神经 网 络 分 类 AP: (T) ÆR ART KARA Z (T) ER AE 
Associated 准确 度 Classification ”准确 度 Classification 为 i 的 夸克 。 它 们 是 通过 对 玻 色 - 爱 因 斯 坦 分 布 和 费 


particle ratio ^ accuracy of dynamic accuracy of point 米 - 狄 拉克 分 布 的 动量 积分 计算 出 来 的 : 
edge convolutional cloud network dy f 
network InZ, (T) 三 三 x] pdp ii ES 
5% 92.8% 83.4% 2 
10% 97.7% 84.8% 1 
| (m 
量 依赖 于 温度 的 准 粒 子 , 作 简单 的 统计 力学 计算 ,可 dV 
以 复 现 Lattice QCD 的 状态 方程 。 InZ,(7)=+ | 
传统 上 ,人 们 可 以 为 温度 依赖 的 准 粒 子 质 量 提 


供 一 个 参数 化 的 函数 MM (0, T), HEP 0 2 Hi Lattice exp -FP +m «m (18) 
QCD 数据 所 确定 的 参数 后 。 然 而 ,这 种 参数 化 的 形 式 中 ;是 系统 的 体积 ;p 是 准 粒 子 的 动量 ;7 是 温度 ; 
式 会 引入 一 些 人 为 先 验 的 诱导 性 偏差 。 男 外 ,这 种 mm.(T) 和 m, (7) 是 神经 网 络 的 输出 。4, 和 d, 是 胶 子 


方法 也 很 难 从 QCD 的 状态 方程 中 确定 两 个 或 者 更 ae i 
"E : |Z o 然后 b £ 公 : 
多 未 知 的 准 粒子 质量 函数 。 为 了 在 不 引入 先 验 偏差 COLO H IRE. TR ee 
的 情况 下 解决 这 个 变 分 问题 ,文献 [42] 采 用 深度 神 pq - r( 4820. (19) 
经 网 络 (Deep Neural Networks,DNN) 来 表示 三 个 未 1 (alnZ(T) d 
知 的 准 夸 克 和 胶 子 质量 函数 ,以 此 作为 专 克 - 胶 子 等 (7) = (22) | (20) 
os E ee FAURE FEAR DE M RE RE 2 
Wy "€ -3P 
图 8 是 三 个 温度 依赖 的 质量 函数 的 神经 网 络 模 。。 们 的 录 密 度 s(7) = 5 Rota C) = 


型 。 这 三 类 准 粒 子 质 量 模型 分 为 上 和 下 夸克 — 攻 0,).m, (T, 0, ) 和 和 
muw( 了 0 小 奇异 夸克 m,(7 六 ) 和 胶 子 me(7,0,), 其 mg (T, 9), 方 法 是 使 网 络 预测 与 Lattice QCD 计算 的 
H 0,.0, 410, € DNN 的 参数 。 每 个 质量 模型 代表 一 s(T) 和 A(7T) 之 间 的 均 方 误 差 最 小 。 在 神经 网 络 的 
个 残 差 神经 网 络 (ResNet) 模 块 。 它 由 两 个 ResNet — 向 前 传播 过 程 中 ,采用 高 斯 - 拉 羡 尔 求 积 法 对 配 分 函 
拼接 而 成 ,每 一 个 ResNet 有 8 个 隐藏 层 ,32 个 神经 元 。 数 公 式 (17) 和 (18) 进 行 数值 积分 。 而 式 (19) 和 (20) 
和 一 个 类 swish 的 激活 函数 。 在 每 个 ResNet 的 末尾 ”中 所 示 的 配 分 函数 的 导数 由 auto-di 企 技术 自动 提 
使 用 sigmoid 激 活 函 数 。 当 网 络 输出 了 准 粒子 的 质 。 供 ,原则 上 具有 解析 精度 。 


a 
| 
l Mass Model 
dl 
Input: T rr 8E Mass Model 
sd 
l, 
n Mass Model T 
| | 


——— 


aus wr maed 


图 8 使 用 深度 神经 网 络 构造 3 个 温度 依赖 的 质量 函数 ,并 且 计 算 配 分 函数 从 而 获得 QCD 的 状态 方程 外 
Fig.8 Framework of the deep neural network when constructing three temperature-dependent mass functions and calculating the 
QCD EoS using DNN learned masses"! 
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FAET: 基于 机 器 学 习 的 重 离子 碰撞 中 QCD 相 变 的 研究 


训练 目标 是 最 小 化 损失 函数 ,其 中 包含 两 个 部 

分 :一 个 是 网 络 输 出 的 烂 密度 和 迹 有 反常 与 Lattice 

QCD 计算 之 间 的 RMSE (Root Mean Square Error); 

男 一 个 是 约束 来 自 于 高 温 时 的 部 分 子 有 效 质 量 。 例 

如 , 硬 热 圈 计算 显示 ,在 高 温情 况 下 , 轻 夸克 (u、qd) 与 
胶 子 的 有 效 质 量 比值 为 : 

R= Marssn 0 [3[Ne | Ne 

"5^ Muro, 213 6 

其 中 :高 温 截断 为 了 ,= 0.150 GeV。 那 么 mm,,(7, 0,) 

TI m, (T, 0;) 之 间 的 约束 可 以 写 为 : 


(21) 


Pme > | (22) 
对 于 奇异 夸克 ,在 高 温 下 的 约束 条 件 被 设 定 为 : 
fma - | (23) 

M, T My 


Him, Gm, AAMT. WA, MAAK BR 
TU: 
L= (sus suu) + (Anse Asa) + Luc (24) 
经 过 随机 梯度 下 降 算法 (Adam) 的 训练 ,深度 神 
经 网 络 学 到 的 质量 函数 不 仅 再 现 了 s(7T) 和 A(7)， 
X BE SU e(T) 和 P(T)。 利 用 HotQCD 和 WB 的 
Lattice QCD 组 的 数据 ,DNN 分别 学 习 了 两 组 质量 函 
数 ,都 可 以 很 好 地 描述 格 点 数据 。 这 种 携带 物理 约 
束 的 多 任务 的 深度 神经 网 络 DNN 显示 了 其 强大 的 
表征 能 力 , 可 用 于 各 种 变 分 问题 。 


6 ”使 用 主动 学 习 (Active learning) HERRAR 
态 方程 中 不 稳定 区 域 


主动 学 习 (Active learning) 是 与 监督 学 习 、 非 监 
督学 习 、 半 监督 学 习 、 自 监督 学 习 以 及 强化 学 习 并 列 
的 一 种 机 器 学 习 方 法 。 在 深度 学 习 时 代 , 监督 学 习 
需要 海量 的 带 标注 数据 ,而 主动 学 习 可 以 在 少 样本 
上 更 加 高 效 地 学 习 。 它 能 够 主动 挑选 重要 的 样本 进 
行人 工 标注 ,然后 使 用 少量 标注 好 的 数据 进行 监督 
学 习 。 主 动 学 习 的 流程 如 图 9 所 示 , 学 习 的 过 程 中 
存在 两 组 数据 集 ,一 组 为 少量 的 已 标注 数据 集 , 记 为 
Labelled Data, 男 一 组 为 大 量 的 无 标注 数据 集 ,只 有 
数据 没有 标签 , 记 为 Unlabelled Pool。 学 习 开始 时 ， 
使 用 Labelled Data 训练 人 工 神 经 网 络 , 然 后 拿 预 训 
练 好 的 人 工 神 经 网 络 来 预测 Unlabelled Pool 中 的 样 
本 。 对 于 简单 样本 ,神经 网 络 非常 自信 ,以 极 高 的 概 
率 将 其 归 为 一 类 ;对 于 复杂 样本 ,神经 网 络 不 确信 ， 
比如 两 分 类 任务 中 , 它 预 测 一 个 样本 属于 第 一 类 的 
概率 为 51%, 属 于 第 二 类 的 概率 为 49%, 此 时 这 个 样 


ul 


T 


Iu 


本 被 称 作 uncertain 样本 ,从 Unlabelled Pool 中 剔除 ， 
进行 人 工 标注 后 放 入 Labelled Data。 使 用 标注 好 的 
数据 集 在 下 一 轮 监督 学 习 训练 时 ,神经 网 络 就 能 从 
困难 样本 中 学 到 更 多 特征 。 挑 选 uncertain 样 本 的 时 
匡 , 可 以 把 预测 结果 的 炉 作为 判 据 , 即 选 择 s= 
= by logp; 大 的 样本 ,也 可 以 多 训练 几 个 人 工 神 经 


网 络 , 形 成 评审 团 , 让 它们 对 同一 个 样本 分 别 作 出 判 
断 ,将 评审 团 成 员 最 不 能 达成 一 致 的 样本 进行 人 工 
标注 ,还 可 以 给 数据 一 个 假想 的 标签 ,计算 9Z/90, 模 
据 梯 度 选 择 对 神经 网 络 参 数 影响 大 的 样本 进行 
标注 。 


—E€-— 人 
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ANS Uncertain e 
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/ 
VY Label 
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E eret 


Labelled Data 


9 主动 学 习 (Active learning) fJ it fa RI 
Fig.9 Flow chart illustrating active learning" 
文献 [43] 介 绍 了 如 何 使 用 主动 学 习 排除 核 物质 
状态 方程 中 的 热力 学 不 稳定 区 域 。 束 流 能 量 扫描 理 
论 合作 组 CBEST) 构造 了 一 种 存在 相 变 临界 点 的 状 
态 方程 中 。 构 造 的 方法 是 将 包含 临界 点 的 三 维 伊 辛 
模型 普 适 类 对 应 的 状态 方程 与 零 重 子 化 学 势 附近 做 
泰勒 展开 的 格 点 QCD 状态 方程 加 权 求 和 。 这 样 构 
造 的 状态 方程 中 临界 区 域 在 核 物 质 相 图 中 的 大 小 和 
位 置 依赖 4 个 参数 ,有 些 参 数组 合 给 出 的 状态 方程 
违背 热力 学 的 稳定 性 与 因果 律 。 使 用 很 小 的 参数 空 
间 ,进行 主动 学 习 训 练 , 人 工 神经 网 络 可 以 在 整个 参 
数 空间 以 96% 的 准确 度 判 断 出 状态 方程 是 否 物理 。 
主动 学 习 技术 在 寻找 合适 的 状态 方程 任务 中 ,显著 
降低 了 机 器 学 习 模 型 对 专家 标注 数据 的 需求 ,并 增 
加 了 训练 速度 与 准确 度 ,可 能 会 为 人 工 智能 与 前 沿 
科学 的 交叉 带 来 更 多 突破 。 


7 非 监督 学 习 核 物质 液 气相 变 


之 前 介绍 的 工作 使 用 监督 学 习 的 方法 ,通过 理 
论 模型 准备 末 态 粒子 谱 或 粒子 云 输入 数据 ,将 理论 
模型 中 使 用 的 状态 方程 或 经 历 的 相 变 类 型 作为 标 
签 ,训练 机 器 学 习 模 型 在 输入 数据 与 标签 之 间 建 立 
映射 。 训 练 完成 之 后 ,机 器 学 习 模 型 可 以 在 实验 数 
据 上 进行 预测 。 这 种 方法 的 局 限 是 理论 模型 无 法 完 
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全 描述 实验 数据 ,两 者 之 间 可 能 存在 偏差 。 而 直接 
使 用 实验 数据 作 监 督学 习 又 会 遇 到 缺少 标注 的 
困难 


非 监督 学 习 是 一 种 机 器 学 习 模 式 , 它 可 以 自动 
地 从 无 标注 的 数据 中 发 现 规律 。 线 性 与 非 线 性 降 维 
Dimensionality reduction, 聚 类 clustering, 自 编 码 机 
Auto Encoder, 生 成 对 抗 网 络 GAN 都 属于 非 监督 学 
习 的 范畴 。 非 监督 学 习 的 一 种 思路 是 使 用 更 少 的 信 
息 重 建 原始 数据 。 比 如 , 非 监 督学 习 中 的 主 成 分 分 
析 CPrincipal Component Analysis, PCA) ,可 以 提取 
数据 中 方差 最 大 的 几 个 维度 作为 主 成 分 ,用 很 少 的 
数据 量 表示 原始 数据 中 最 重要 的 信息 。PCA 被 用 来 
分 析 末 态 粒子 在 动量 空间 的 各 向 异性 流 , 研 究 发 现 
通过 主 成 分 分 析 提 取 的 各 向 异性 流 与 初始 时 刻 能 量 
密度 分 布 的 几何 各 向 异性 存在 更 佳 的 线性 映射 关 
系 , 显 示 相 对 论 流 体力 学 对 不 同 模式 的 非 线 性 耦合 
并 没有 人 们 预期 的 强 " 中 。 自 编码 机 一 般 使 用 两 边 大 
中 间 小 的 瓶 贷 结 构 , 将 输入 映射 到 输出 ,损失 函数 定 
义 为 输出 输入 之 间 的 距离 , 即 重 建 误差 。 经 过 学 习 ， 
自 编码 机 瓶颈 处 的 神经 元 存储 着 输入 数据 中 最 重要 


(a) 10? 


的 信息 。 可 以 认为 带 瓶 颈 的 自 编码 机 起 到 非 线 性 降 
维 作用 。 
文献 [46] 使 用 非 监 督学 习 中 的 自 编码 机 ,从 无 
标注 的 重 离子 碰撞 实验 数据 中 学 习 , 进 行 核 液 气 相 
变 分 类 。 如 果 碰 撞 能 量 很 低 , 原 子 核 被 激发 后 处 于 
单 极 震 荡 并 偶发 轻 粒 子 , 此 时 处 于 液 相 ,碰撞 能 量 增 
加 后 , 原子核 激 发 后 进入 spinodal X ,因为 核子 核子 
之 间 的 吸引 相互 作用 形成 中 等 质量 的 核 碎片 ,此 时 
处 于 液 气相 变 区 ,继续 增加 碰撞 能 量 ,原子 核 会 快速 
越过 spinodal 区 ,时 间 不 足以 形成 中 等 质量 核 碎 片 ， 
最 终 发 射出 大 量 轻 原子 核 。 如 图 10 所 示 , 不 同 碰撞 
能 量 以 及 物 态 对 应 的 核 碎 片 的 电荷 分 布 有 明显 区 
别 。 文 献 L46] 将 核 核 碰撞 末 态 的 带电 粒子 碎片 的 产 
额 乘 以 其 电荷 数 , 即 ZM.(Z) 作为 神经 网 络 的 输入 ， 
使 用 带 瓶 颈 的 自 编 码 机 来 重建 输入 分 布 。 实 验 数据 
用 图 10 中 的 虚线 表示 , 自 编码 机 的 重建 结果 用 空心 
圆 点 表示 ,两 者 较 好 符合 。 训 练 完 成 之 后 ,瓶颈 处 的 
神经 元 取 值 出 现 明 显 的 序 参 量 特征 ,可 被 用 来 区 分 
核 液 气相 变种 类 。 
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图 10 使 用 自 编码 机 从 重 离子 碰撞 实验 数据 中 学 习 HEAT RAD 


Fig.10 Classification of nuclear liquid gas phase transition using an auto encoder, which learns from the experimental data of 


heavy-ion collisions 


8 ”确定 核对 称 能 


在 中 低能 重 离子 碰撞 中 , 核 物质 状态 方程 作为 
能 够 表征 核 物质 能 量 在 不 同 的 密度 、 温 度 以 及 同位 
旋 不 对 称 度 的 关系 ,一 直 以 来 都 是 理论 与 实验 研究 
的 热点 之 一 文献 [47-53]。 对 于 理论 而 言 , 状 态 方程 
是 非常 重要 的 初 态 输入 量 ,直接 影响 了 重 离子 碰撞 
的 动力 学 演化 过 程 。 对 于 同位 旋 非 对 称 核 物质 ,在 


imi 


[46 


部 分 ,如 何 通过 未 态 观 测量 对 他 进行 约束 ,从 而 获得 
核 物 质 状 态 方程 也 引起 了 众多 核 物理 工作 者 的 关 


不 考虑 温度 时 ,其 状态 方程 一 般 可 描述 为 : 

E(p,6) = E(p,0) + E,,(p)À^ + O(9) (25) 
其 中 :6=(p, - p,)/ Cp, + p,) AN Ir] f Je AS AT BK E s 
E(p,0) 与 同 为 旋 无 关 为 对 称 核 物 质 能 量 ; E (p) 
为 对 称 能 项 。 对 称 能 作为 构成 状态 方程 非常 重要 的 


_ p- pr), Kum{p - po) 3 
= S, + + + 
Elo) = S e 12x Pe] + eee) ol) 
(26) 
OE m — R N 
EHL = 3p of) 表示 饱和 密度 处 的 斜率 
P 7 po 
9 E (p) 


ZG Ku = 9p 为 曲率 参数 。 


2 


op =Po 
目前 ,理论 上 所 给 出 的 高 密度 区 域 的 对 称 能 
存在 很 大 的 差异 ,但 是 对 于 末 态 粒子 分 布 的 影响 不 
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十 分 明显 。 文 献 L54] 采 用 了 卷 积 神经 网 络 的 方法 ， 
通过 对 末 态 质子 谱 的 学 习 , 能 够 有 效 识别 出 初 态 的 
对 称 能 的 类 型 。 其 中 , 逐 事件 的 二 分 类 精度 最 高 能 
达到 60% 左右 ,而 100 个 事件 琶 加 的 二 分 类 最 高 能 
达到 98% 左右 ,并 且 还 采用 100 个 事件 全 加 的 方式 
进行 了 五 分 类 的 测试 ,其 分 类 的 精度 在 末 态 质子 谱 
上 能 达到 5$8% ,在 中 子 谱 上 能 到 达 72%。 该 研究 团 
队 还 进行 了 工 的 回归 测试 ,在 使 用 质子 和 中 子 的 情 
况 下 ,CNNCConvolutional Neural Networks) 预测 的 
工 和 真实 的 LL 之 间 的 平均 绝对 误差 分 别 为 20.4 MeV 
和 14.8 MeV。 此 外 ,文献 L55] 还 使 用 了 LightGBM 
算法 。 通 过 对 所 构造 的 30 个 末 态 特征 量 的 逐 事件 
进行 学 习 ,LightGBM 能 够 将 对 称 能 斜率 参数 工 的 平 
均 绝 对 误差 控制 在 30 MeV 左右 ,并 且 模 型 还 具有 很 
强 的 鲁 棒 性 和 泛 化 能 力 ,如 图 11 所 示 。 


MAE-29.6 MeV 
9 000 F 


6 000 F 


Counts 


3 000+ 


0 20 40 60 80 100 120 140 160 180 
Distribution of the Predicted L(p,) /MeV 


11 LightGBM fal RBS RL RO 23 f e DLE 3 80 
Fig.11 Distribution of the slope L parameters predicted by 
LightGBM^? 


9 ”深度 学 习 寻 找 QGP 中 的 马赫 锥 
介质 中 高 速 运动 的 物体 由 于 与 介质 的 相互 作用 


A. y. ERU I e EE Es UT I EI B VIT A t 
也 比较 敏感 。 但 是 ,寻找 QGP 中 的 马赫 锥 信号 异 
常 艰难 ,因为 马赫 锥 的 形状 会 受到 喷 注 的 初始 产生 
位 置 以 及 集体 流 的 共同 影响 。 

文献 [58] 使 用 机 器 学 习 辅 助 的 喷 注 层 析 技 术 研 
究 高 能 核磁 撞 中 产生 的 马赫 锥 。 如 图 12(b) 所 示 ， 
朝 同 一 个 方向 出 射 的 高 能 部 分 子 喷 注 ,如 果 在 QGP 
中 初始 产生 位 置 不 同 , 则 最 终 马赫 锥 的 形状 会 同时 
受到 局 部 温度 和 流速 的 影响 。 在 高 温 区 ,介质 中 奔 
克 和 胶 子 的 密度 更 高 , 喷 注 与 介质 的 散射 概率 增 大 ， 
马赫 锥 偏向 高 温 区 。 但 另 一 方面 ,集体 流 沿 着 温度 
梯度 的 方向 ,又 会 导致 马赫 锥 向 低温 区 偏转 。 两 个 
效应 存在 竞争 ,文献 [58] 使 用 线性 玻 尔 兹 曼 输 运程 
H* LBT (Linear Boltzmann Transport)” 和 相对 论 流 
体力 学 模拟 程序 CLVisc!' 来 产生 末 态 粒子 分 布 与 
初 态 喷 注 产 生 位 置 训 练 数据 集 。 图 12(a) 展 示 了 用 
于 喷 广 初始 产生 位 置 预测 的 点 云 神经 网 络 架 构 。 神 
经 网 络 的 输入 包含 两 部 分 ,第 一 部 分 是 动量 空间 的 
末 态 粒子 云 , 通 过 一 维 卷 积 将 每 个 粒子 的 特征 变换 
到 高 维特 征 空间 ,并 使 用 全 局 最 大 池 化 获得 粒子 与 
粒子 之 间 的 相对 关系 ,第 二 部 分 是 喷 注 的 全 局 信息 ， 
比如 在 光子 标定 的 喷 注 中 ,光子 的 横 动 量 , 快 度 和 方 
位 角 以 及 使 用 fastjet “获取 的 喷 注 的 横 动量 , 快 度 和 
方位 角 被 送 入 一 个 全 连接 网 络 Multilayer 
Perceptron, MLP) 进 行 特 征 变 换 。 两 部 分 输入 被 拼 
接 之 后 ,再 送 入 最 后 的 回归 网 络 ,输出 两 个 数字 (x， 
y) ,用 来 表示 高 能 部 分 子 喷 注 的 初始 产生 位 置 。 使 
用 此 技术 ,可 以 从 大 量 的 事件 中 挑选 来 自 特定 区 域 
的 高 能 部 分 子 喷 注 ,它们 受到 温度 梯度 和 集体 流 的 
影响 基本 一 致 , 不 会 因为 事件 平均 而 损失 信息 ,能 够 
极 大 增强 马赫 锥 和 耗 散 尾 流 的 物理 信号 。 更 详细 的 


损失 能 量 ,比如 子弹 在 水 中 飞行 1m 左 右 即 可 失去 
杀伤 力 。 如 果 物 体 的 飞行 速度 大 于 介质 中 的 声速 ， 
就 会 产生 音 爆 ,在 飞行 方向 压缩 出 马赫 锥 ,在 后 方 留 
下 耗 散 尾 流 。 相 对 论 重 离子 碰撞 产生 的 高 能 部 分 子 
穿 过 QGP 时 会 与 热 密 介 质 中 的 热 夸 克 和 胶 子 发 生 
强 相 互 作用 ,通过 弹性 碰撞 和 股子 辐射 损失 能 量 。 
损失 的 能 动量 沉积 在 QGP 中 , 带 来 的 扰动 在 QGP 中 
以 声速 传播 。 因 为 高 能 部 分 子 的 速度 接近 光速 , 远 
超 QGP 中 的 声速 c, = 1/ V3 ,预期 会 在 QGP 中 产生 
马赫 锥 和 耗 散 尾 流 "H。 马 赫 锥 的 半 锥 角 09 与 声速 c, 
和 部 分 子 的 飞行 速度 c 之 间 存 在 简单 三 角 函 数 关系 
sin0 = c,/c。 如 果 能 在 重 离子 碰撞 实验 中 寻找 到 马 
赫 锥 的 信号 ,测量 到 马赫 锥 的 半 锥 角 0, 则 可 以 通过 
AK c = dP/de 直接 获得 热 密 核 物 质 的 状态 方程 信 


信息 请 参考 文献 L58j]。 
10 ”深度 学 习 辅 助 Lattice QCD 计算 


深度 学 习 模 型 可 分 为 判别 模型 (分 类 与 回归 ) 和 
生成 模型 ,生成 模型 能 够 从 大 量 样本 中 学 习 到 样本 
本 身 的 统计 规律 ,从 而 产生 新 的 采样 。 生 成 模型 有 
很 多 种 ,比如 变 分 自 编码 机 VAE (Variational 
AutoEncoder) ,生成 对 抗 网 络 GAN (Generative 
Adversarial Networks) , 自 回归 网 络 , 流 模型 Flow 
model 以 及 最 近 出 现 的 扩散 模型 Diffusion model。 
这 些 模 型 在 图 像 与 自然 语言 生成 任务 中 的 应 用 如 雷 
贯 耳 , 比 如 最 早 的 视频 换 脸 使 用 了 VAE 技 术 , 生 成 
以 假 乱 真 的 图 片 使 用 了 GAN All Flow model, Yr Hj 
stable diffusion 模型 ,可 以 根据 文字 提示 生成 复杂 而 
真实 的 艺术 图 像 。 能 够 完成 多 轮 对 话 , 让 人 怀疑 机 
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图 12 ”深度 学 习 辅助 的 喷 注 层 析 技 术 ,定位 高 能 部 分 子 的 初始 产生 位 置 ,帮助 寻找 核 液 滴 中 的 马赫 锥 
Fig.12 Deep learning assisted jet tomography used to locate the initial jet production positions and aid in searching the Mach cone 
in nuclear liquid" 


器 已 经 拥有 自我 意识 的 ChatGPT 则 使 用 了 自 回 归 模 
7! Transformer. 

既然 深度 学 习 中 的 生成 模型 可 以 从 大 量 样本 中 
学 习 , 并 产生 新 的 采样 ,人 们 自然 开始 思考 它 是 否 可 
以 加 速 自然 科学 领域 的 蒙特 卡 罗 采 样 。 比 如 在 高 能 
核 物理 领域 ,Lattice QCD 使 用 马尔 科 夫 链 蒙 特 卡 罗 
MCMC (Markov Chain Monte Carlo) 方 法 及 其 变种 ， 
比如 Hybrid Monte Carlo AIE , MA BR ia EE P 
克 场 和 胶 子 场 的 配 分 函数 采样 ,获得 大 量 场 的 构 型 ， 
来 计算 核 物质 的 状态 方程 ( 即 压强 能量 密度 、 灶 密 
度 与 温度 的 关系 )。 如 果 生 成 模型 可 以 从 少量 的 昂 
贵 样 本 中 学 习 , 然 后 进行 更 大 规模 地 采样 , 则 可 以 加 
速 第 一 性 原理 Lattice QCD 的 计算 。 文 献 [61] 使 用 
GAN 来 抽样 有 限 温 度 下 的 1+1 维 复 标量 场 。GAN 
包含 一 个 生成 网 络 , 将 一 些 随 机 数 映射 到 复 标量 场 
的 构 型 ,使 其 尽 可 能 地 以 假 乱 真 , 还 包含 一 个 判别 网 
络 , 来 最 大 化 生成 构 型 与 真实 构 型 的 判别 准确 度 。 
两 种 网 络 在 博弈 中 逐渐 达到 均衡 ,此 时 生成 网 络 学 
习 到 复 标量 场 满足 的 分 布 。 如 果 一 开始 的 随机 数 满 
足 特 定 的 分 布 , 比 如 简单 的 标准 正 态 分 布 , 则 可 以 从 
标准 正 态 分 布 采样 一 个 随机 数 ,输入 经 过 预 训 练 的 
生成 模型 从 而 产生 一 个 复 标 量 场 的 构 型 。 图 13 是 
蒙特 卡 罗 方 法 与 生成 对 抗 网 络 方法 采样 得 到 的 复 标 
量 场 平方 的 概率 密度 分 布 ,两 者 相差 不 大 。 重 要 的 
是 ,训练 好 的 生成 模型 可 以 并 行 采样 ,而 不 必 像 
MCMC 模 型 一 样 只 能 以 序列 化 的 方式 串 行 采样 。 

MCMC 方 法 采样 的 时 候 从 一 个 样本 出 发 ,通过 
随机 行走 获得 下 一 个 样本 , 相 邻 样本 之 间 存 在 时 间 
上 的 自 关 联 。 在 参数 空间 的 临界 点 附近 ,时 间 上 的 
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图 13 ”蒙特 卡 罗 方法 与 生成 对 抗 网 络 采样 得 到 的 复 标量 场 
平方 的 概率 密度 分 布 对 比 图 四 
Fig.13 Flow chart illustrating active learning! 
自 关 联 长 度 发 散 ,从 而 使 得 采样 效率 变 得 极 低 , 称 作 
critical slowing down。 文 献 L62-64j 使 用 流 模型 和 
生成 对 抗 网 络 辅助 马尔 科 夫 链 蒙 特 卡 罗 采 样 ,能 
显著 减 小 自 关 联 时 间 , 加 速 critical slowing down 区 
域 的 采样 效率 。 另 外 ,训练 好 的 流 模型 与 GAN 一 
样 , 可 以 使 用 满足 简单 分 布 的 随机 数 , 做 到 Lattice 
QCD 场 构 型 的 并 行 采样 。 流 模型 使 用 了 与 变换 法 
抽样 相同 的 思路 , 即 为 了 从 一 个 复杂 的 概率 密度 分 
布 采样 ,可 以 先 从 一 个 简单 的 概率 密度 分 布 采样 ,将 
采样 结果 进行 变量 蔡 换 ,使 得 蔡 换 后 的 变量 满足 复 
杂 的 概率 密度 分 布 函数 。 最 简单 的 例子 是 Box- 
Muller 变换, 可 以 从 均匀 分 布 采样 ,经 过 变换 获得 满 
足 标准 正 态 分 布 的 样本 。 另 一 个 例子 是 反 函 数 法 采 
样 , 求 出 概率 密度 分 布 的 累积 概率 函数 ,0~1 区 间 的 
均匀 分 布 采样 ,做 反 函 数 变 换 , 即 可 得 到 原始 概率 密 
度 分 布 的 采样 。 
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在 流 模型 中 ,假设 简单 的 概率 密度 分 布 函数 为 
f(z), 复 杂 的 概率 密度 分 布 为 p($), 可 以 先 从 f(z) 
采样 得 到 z, 使 用 流 模型 做 变量 替换 ,yp = 9 '(z), 其 
Ho's RY 一 R" 是 一 个 光滑 、 双 射 的 流 模型 ,根据 保 
概率 条 件 ,这 样 变换 得 到 的 g 满 足 5($)dy|= 
lf (z)dz| BU 9 Kati: 

dg (9) (27) 


BU) =f (2) e ere m 


"n AR Ail Zi s WU p (9) 并 不 等 于 我 们 需要 的 概 
率 密 度 分 布 ,一 般 可 以 使 用 Kullback-Leibler KL) 
Divergence 计算 两 个 分 布 之 间 的 距离 ,将 其 定义 为 
损失 函数 ,通过 优化 来 使 得 (4) 逐渐 台 近 p (9). Tit 
模型 是 一 个 可 逆 双 射 的 神经 网 络 ,通过 构造 的 方法 
可 以 使 得 其 雅克 比 箱 阵 | 号 (和 | 易于 计算 。 

最 近 几 年 ,科学 家 发 现 如 果 把 场 流 形 通过 特定 
的 方法 变换 到 复 空间 , 沿 着 相应 的 路 径 进 行 积 分 可 
能 消除 符号 问题 仿 趾 ,但 流 形 的 选择 需要 专家 知识 
以 及 非常 复杂 且 昂 贵 的 计算 。 机 器 学 习 被 用 来 发 现 
这 样 的 积分 流 形 , 帮助 消除 符号 问题 。 如 果 能 
够 完全 解决 符号 问题 ,会 大 大 推进 对 有 限 密度 区 域 
QCD 相 图 的 研究 。 


1 结语 


本 文 综述 了 机 器 学 习 在 重 离子 碰撞 领域 辅助 
QCD 相 变 以 及 核 物质 状态 方程 研究 的 几 种 方法 和 
思路 。 深 度 学 习 辅 助 核 物 质 状 态 方程 研究 的 方法 可 
以 分 为 两 类 ,一 类 是 直接 法 ,试图 在 第 一 性 原理 计算 
中 帮助 解决 Lattice QCD 的 采样 困难 以 及 符号 问题 
另 一 类 是 间接 法 ,通过 理论 模型 与 核 碰 撞 实 验 的 对 
EE ,根据 未 态 粒子 谱 反 向 推断 核 物质 状态 方程 以 及 
相 变 种 类 。 这 些 方法 包括 贝 叶 斯 推断 、 卷 积 神经 网 
络 、 点 云 神经 网 、 自 编码 机 以 及 基于 图 结构 的 神经 网 
络 。 这 些 网 络 一 般 被 用 在 分 类 任务 中 ,通过 监督 学 
习 来 建立 末 态 粒子 谱 或 粒子 云 与 状态 方程 种 类 、 临 
界 涨 落 、 喷 注 产 生 位 置 的 非 线性 映射 关系 ,或 用 在 重 
建 任务 中 ,通过 非 监督 学 习 提 取 能 够 反映 核 物质 相 
变 的 序 参数 。 这 些 关 系 都 能 间接 帮助 确定 QCD 相 
图 中 的 核 物质 相 变种 类 或 临界 点 的 位 置 。 除 此 之 
外 ,深度 神经 网 络 也 被 用 作 变 分 函数 ,来 表示 QGP 
中 准 粒子 的 质量 ,从 而 能 够 通过 自动 微分 和 优化 ,学 
习 到 介质 中 was 夸克 以 及 胶 子 的 有 效 质量 ,在 简单 
的 统计 力学 公式 中 重 现 Lattice QCD 的 状态 方程 
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